شماره: 1662
1397/11/07
روش‌های مناسب برای شناسایی داده‌های پرت و نحوه‌ی برخورد با آن‌ها در آمارگیری از هزینه و درآمد خانوار

در مسایل کاربردی گاهی پاسخ مشاهده شده برای برخی از آزمودنی‌ها ممکن است با مدل برازش شده برای اکثر داده‌ها توافق نداشته باشد. برای مثال در داده‌های آمارگیری از درآمد و هزینه خانوارها، در مدل‌بندی لگاریتم هزینه کل در مقابل برخی از متغیرهای تبیینی، ممکن است لگاریتم هزینه برخی از پاسخ‌دهنده‌ها با بقیه پاسخ‌دهنده‌ها به طور محسوسی متفاوت باشند. در مدل‌بندی چنین پاسخ‌هایی ممکن است برای مثال نمودار جعبه‌ای مانده‌های استیودنتیده نشان ‌دهد که در مدل برازش شده برای لگاریتم هزینه در مقابل سن و جنس برخی از مقادیر لگاریتم هزینه از مدل برازش شده دورند. این‌گونه پاسخ‌ها که از مدل یکسانی که به اکثر آزمودنی‌ها برازش می‌شود فاصله دارند

حق انتشار محفوظ است ©